[レポート]みなさん体験可能なクラウド運用をインテリジェントに自動化する「SUP402-R | Intelligently automating cloud operations」に参加しました #AWSreInvent #SUP402

[レポート]みなさん体験可能なクラウド運用をインテリジェントに自動化する「SUP402-R | Intelligently automating cloud operations」に参加しました #AWSreInvent #SUP402

Clock Icon2024.12.06

re:Invent2024に参加している。たかやまです。

現在開催中のre:Invent2024で行われたWorkshop「SUP402-R | Intelligently automating cloud operations」のレポートをお伝えします。

セッション概要

タイトル : SUP402-R | Intelligently automating cloud operations

このワークショップに参加すると、AWS Health、AWS Trusted Advisor、AWSのジェネレーティブAIと機械学習サービスを使用して、クラウド運用をインテリジェントに自動化する方法を学ぶことができます。 また、Amazon EventBridgeとAWS Lambdaを使用して、組織がクラウドインフラストラクチャを最適化し、効率を向上させ、運用コストを削減するために使用できる自動化を作成する方法を学びます。 このワークショップは、クラウド管理者、DevOpsエンジニア、サイト信頼性エンジニア、およびクラウドオペレーションの管理と最適化を担当するITプロフェッショナルを対象としています。 参加にはノートパソコンが必要です。

スピーカー :
・Francesco Penta, Principal Cloud Support Engineer, Amazon Web Services
・Milan Karalic, Principal SysDev, Amazon Web Services

セッションレベル : 400

Workshopをやってみた

はじめに、このWorkshopはこちらで公開されているのでせひやってみてください!!

https://catalog.workshops.aws/intelligently-automating-cloud-operations/en-US

では、やろうかなと気になっている方向けに。
全体のシナリオ構成としてオプションを含めて以下の5つの構成に分けられており、それぞれの構成で独立しているので気になる箇所から進めていただいて問題ありません。

  • AWS Health Abuse Events
  • Automatic Code Rollback
  • Automated troubleshooting and remediation at scale
  • Summarize operational insights using Amazon Q Business
  • (Bonus) Al Ops for serverless

私は今回 AWS Health Abuse Events / Automated troubleshooting and remediation at scale の2つを進めてみたのでそちらの内容をお伝えします。

他のシナリオも導入の内容を載せておくので気になるものがあれば、ぜひためしてみてください。

AWS Health Abuse Events

こちら内容の導入は以下の通りです。

CleanShot 2024-12-04 at 23.05.15@2x.png
AWS Health Abuse Events - Introduction

個人的にこのシナリオで面白かった部分は、Lambda関数の作成にAmazon Q Developerを活用するところです。

IDEでAmazon Qを利用できるのは知っていましたが、Lambdaのコンソール上でもAmazon Qを活用したコーディングができるのは知りませんでした。
(現時点でバージニア北部のみ対応)

シナリオの中ではプロンプトをコード内のコメントとして渡して、その下にAmazon Q Developerにコードを作成させるという流れでした。

CleanShot 2024-12-04 at 23.21.22@2x.png

結果的にLambda関数の内容はAmazon Q Developerに作成させるかたちになりますが、最後のソリューションテストの時に無事に通ったときは おぉ! となりました。

非常に便利な機能なので東京リージョンでも早く対応してほしいですね。

Automated troubleshooting and remediation at scale

2つ目にやった内容の導入は以下の通りです。

CleanShot 2024-12-04 at 23.26.05@2x.png
Automated troubleshooting and remediation at scale - Introduction

個人的にこのシナリオで学びになった部分は、AWS Support Automation Workflows (AWS SAW)の存在を知れたことです。

SAWとは、お客様の問題を解決して得たベストプラクティスを基に、AWSサポートエンジニアリングによって作成されているランブックです。

今回使ったのはSAWのAWSSupport-TroubleshootSSHで、応答しないインスタンスの問題修復などを解決してくれるものになります。
インスタンスに応答/接続できない場合、基本的に停止させてのボリュームデタッチ/アタッチなどの対応が必要になりますが、このSAWを使うことで停止させることなく状況を解決できるようになります。

CleanShot 2024-12-04 at 23.45.47@2x.png

その他同時実行数の制御の部分も学びになりました。

Automatic Code Rollback

CleanShot 2024-12-04 at 23.50.00@2x.png
Automatic Code Rollback - Introduction

Summarize operational insights using Amazon Q Business

CleanShot 2024-12-04 at 23.50.40@2x.png
Summarize operational insights using Amazon Q Business - Introduction

Al Ops for serverless

CleanShot 2024-12-04 at 23.54.21@2x.png
(Bonus) Al Ops for serverless - Introduction

最後に

このWorkshopを通して普段触れていなかった運用に役立ちそうな機能をキャッチアップすることができました。

当日やれたWorkshopの内容を後日もできるように公開されているのは嬉しいですね!

今回やった2つのシナリオは両方面白かったので、ぜひ他のシナリオもやってみたいと思います。

この記事が誰かのお役に立てれば幸いです。

以上、たかやま(@nyan_kotaroo)でした。

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.